Source | # of sentences | Average logarithmic rank |
---|---|---|
http://uudised.err.ee/v/eesti/0aa4df09-bca2-41d7-bce2-35395eb92eba | 12 | 5.09 |
http://www.kesknadal.ee/g2/uudised?id=15267 | 12 | 5.26 |
http://www.postimees.ee/2498839/siim-kallas-lubab-vastutada | 17 | 5.28 |
http://www.vooremaa.ee/kiri-koigile-eestimaa-inimestele/ | 11 | 5.29 |
http://www.aripaev.ee/uudised/2014/10/16/jogevamaa-top-kokkuhoidlik-tootmine-toi-kasvu | 14 | 5.29 |
http://uudised.err.ee/v/eesti/c290b8b4-6cbc-4123-ac06-84ae187a7ffa | 11 | 5.32 |
http://www.postimees.ee/1525529/baskin-meil-on-nii-kuni-raeusata-suudad-seni-toeoetab | 18 | 5.38 |
http://sport.err.ee/v/korvpall/4e01a1cc-de17-4eb7-984f-6f714d6cb227 | 12 | 5.42 |
http://www.postimees.ee/1060294/president-naeeb-eesti-poliitika-ja-majanduse-novembripimeduses-lootusekiiri | 19 | 5.43 |
http://www.postimees.ee/3644363/kallas-ma-pole-savisaarega-parast-2013-aastat-kohtunud | 11 | 5.47 |
http://www.postimees.ee/1516555/aastalopp-ei-lase-maarjal-suennipaeevale-moelda | 12 | 5.51 |
http://uudised.err.ee/v/eesti/88e5962a-ae3d-4b7d-ab9e-ba4c32aa726b/simson-pealtnagijale-keskerakonnast-lahkujate-suhted-on-sageli-lainud-hapuks-edgar-savisaarega | 31 | 5.51 |
http://www.ohtuleht.ee/678710/mart-laar-minu-eesmark-poliitikas-oli-poorata-eesti-idast-laande-ja-muuta-see-suund-poordumatuks | 24 | 5.53 |
http://www.aripaev.ee/uudised/2013-06-28/johannes_wientjes_olen_voitleja | 17 | 5.54 |
http://www.vooremaa.ee/mis-on-luual-elamises-head-mis-halba/ | 13 | 5.54 |
https://www.meiemaa.ee/index.php?content=artiklid=54=69877 | 12 | 5.54 |
http://www.postimees.ee/2514421/aadrilaskmine-tallinna-politseis-peaks-jatkuma | 11 | 5.55 |
http://www.postimees.ee/3158283/ossinovski-ligist-intervjuus-pealtnagijale-ootused-tema-suhtes-ei-ole-ulemaara-korged | 11 | 5.56 |
http://www.linnaleht.ee/726555/kuidas-panna-lapsed-maailma-avastama-ja-paasta-nad-digipoorasusest | 17 | 5.56 |
http://uudised.err.ee/v/eesti/a990569b-7988-47c1-97f9-277b993cae83/lastekaitsetootajad-raakisid-pealtnagijale-oma-too-muutidest-ja-tegelikkusest | 11 | 5.56 |
http://www.hiiuleht.ee/2011/12/intervjuu-regionaalministriga/ | 13 | 5.57 |
http://www.kesknadal.ee/g2/uudised_kommentaar?lk=3=18080 | 11 | 5.57 |
http://www.ohtuleht.ee/583843/kommentaarid | 12 | 5.58 |
http://www.postimees.ee/408338/mees-kes-teab-viha-ravi-retsepti | 12 | 5.58 |
http://www.postimees.ee/2498705/mart-siimann-kaitseb-tiit-vahit | 13 | 5.58 |
http://uudised.err.ee/v/eesti/b233728e-bfa0-43e1-b833-00334287591f | 14 | 5.59 |
http://www.ohtuleht.ee/675673/maarja-liis-ilus-olen-oppinud-et-ulioluline-on-teha-asju-mis-sulle-meeldivad-siis-see-koik-kukub-loogilisena-valja | 23 | 5.60 |
http://www.postimees.ee/299797/vordoiguslikkuse-volinik-palju-jaei-tegemata | 16 | 5.60 |
http://www.postimees.ee/3375531/maanteeameti-peadirektor-altkaemaksuskandaalist-see-on-absoluutselt-ennekuulmatu | 14 | 5.61 |
http://uudised.err.ee/v/arvamus/3f4ba0a8-7ca6-423e-a712-0da22cc8b639 | 18 | 5.61 |
Source | # of sentences | Average logarithmic rank |
---|---|---|
http://www.postimees.ee/teema/reese_witherspoon | 11 | 8.86 |
http://www.postimees.ee/teema/lennupiletid | 22 | 8.80 |
http://www.postimees.ee/teema/zac_efron | 17 | 8.76 |
http://www.postimees.ee/teema/eerik_jago | 14 | 8.74 |
http://www.postimees.ee/teema/konkurss | 11 | 8.68 |
http://www.postimees.ee/teema/justin_timberlake | 19 | 8.66 |
http://www.postimees.ee/teema/irina_shayk | 11 | 8.62 |
http://www.delfi.ee/news/paevauudised/eesti/taismahus-loe-milles-kolm-erakonda-kokku-leppisid?id=71197919 | 12 | 8.62 |
http://www.aripaev.ee/uudised/2014/03/24/palgamaksjate-top | 24 | 8.61 |
http://www.postimees.ee/teema/rattasport | 13 | 8.57 |
http://www.postimees.ee/teema/p%C3%BChaj%C3%A4rve | 11 | 8.56 |
http://www.postimees.ee/teema/hispaania | 11 | 8.54 |
http://www.postimees.ee/1971527/taiuslikkuse-poole-puudlev-pijpers-peab-end-toohulluks | 11 | 8.54 |
http://sport.err.ee/l/laskesuusatamine | 13 | 8.53 |
http://sport.err.ee/l/kasipall | 14 | 8.52 |
http://www.postimees.ee/teema/muuga | 11 | 8.50 |
http://www.postimees.ee/teema/britney_spears | 25 | 8.50 |
http://www.postimees.ee/2509415/postimehe-kalleim-tootaja-karikaturist-nemvalts-postimehe-paev-kattis-raekoja-hiigelpildiga-ja-toi-taas-kokku-palju-inimesi | 11 | 8.48 |
http://www.delfi.ee/news/paevauudised/eesti/tartu-valiti-eesti-elamisvaarseimaks-linnaks?id=18723659 | 11 | 8.46 |
http://www.postimees.ee/teema/paris_hilton | 21 | 8.46 |
http://www.postimees.ee/teema/lehm | 13 | 8.44 |
http://www.postimees.ee/teema/heidi_klum | 21 | 8.43 |
http://www.postimees.ee/teema/demineerijad | 14 | 8.42 |
http://www.postimees.ee/teema/hanna-liina_v%C3%B5sa | 14 | 8.41 |
http://www.postimees.ee/teema/kilingi-n%C3%B5mme | 13 | 8.40 |
http://www.postimees.ee/teema/meistriv%C3%B5istlused | 13 | 8.40 |
http://www.postimees.ee/teema/ratsutamine | 13 | 8.40 |
http://www.postimees.ee/teema/surmanuhtlus | 12 | 8.39 |
http://www.postimees.ee/teema/tanel_laanm%C3%A4e | 11 | 8.39 |
http://www.postimees.ee/teema/laip | 11 | 8.39 |
In this subsection we replace average word length by average logarithmic word rank. The logarithm of the word rank is taken because we want to punish words of high ranks only moderately.
First table:
select source, count(distinct i_s.s_id) as cnt_s, round(avg(log(w.w_id-100)),2) as av from sources so, inv_so i_s, inv_w i, words w where so.so_id=i_s.so_id and i_s.s_id=i.s_id and i.w_id=w.w_id and w.w_id>100 group by source having cnt_s>10 order by av LIMIT 30;
6.4.2.1 Average word length for different sources
6.4.2.3 Sources consisting of many / few words with frequency 1
6.4.2.4 Sources with low / high average word length of rare words